检索结果

Select

1. 深浅层表示融合的半监督视频目标分割

吕潇, 宋慧慧, 樊佳庆

《计算机应用》唯一官方网站 2022, 42 (12): 3884-3890. DOI: 10.11772/j.issn.1001-9081.2021091636

摘要（180）

HTML （4）

PDF （1463KB）（69）

为了解决半监督视频目标分割任务中，分割精度与分割速度难以兼顾以及无法对视频中与前景相似的背景目标做出有效区分的问题，提出一种基于深浅层特征融合的半监督视频目标分割算法。首先，利用预先生成的粗糙掩膜对图像特征进行处理，以获取更鲁棒的特征；然后，通过注意力模型提取深层语义信息；最后，将深层语义信息与浅层位置信息进行融合，从而得到更加精确的分割结果。在多个流行的数据集上进行了实验，实验结果表明：在分割运行速度基本不变的情况下，所提算法在DAVIS 2016数据集上的雅卡尔（J）指标相较于学习快速鲁棒目标模型的视频目标分割（FRTM）算法提高了1.8个百分点，综合评价指标为J和F得分的均值J&F相较于FRTM提高了2.3个百分点；同时，在DAVIS 2017数据集上，所提算法的J指标比FRTM提升了1.2个百分点，综合评价指标J&F比FRTM提升了1.1个百分点。以上结果充分说明所提算法能够在保持较快分割速度的情况下实现更高的分割精度，并且能够有效区别相似的前景与背景目标，具有较强的鲁棒性。可见所提算法在平衡速度与精度以及有效区分前景背景方面的优越性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于距离加权重叠度估计与椭圆拟合优化的精确目标跟踪算法

王宁, 宋慧慧, 张开华

计算机应用 2021, 41 (4): 1100-1105. DOI: 10.11772/j.issn.1001-9081.2020060869

摘要（353）

PDF （2560KB）（299）

为解决判别式相关滤波（DCF）跟踪算法在跟踪目标旋转或非刚性形变时的模型漂移、尺度粗糙、跟踪失败问题，提出一种基于距离加权重叠度估计与椭圆拟合优化的精确目标跟踪算法（DWOP-EFO）。首先，同时采用矩形框之间的重叠度和中心距离作为动态锚框质量评价的依据，能够缩小预测结果与目标区域之间的空间距离，缓解模型漂移问题；其次，为了进一步提高跟踪精度，采用轻量化的目标分割网络将目标从背景中分割出来，再利用椭圆拟合算法对分割轮廓进行优化并输出稳定的旋转矩形框，实现对目标尺度的精确估计；最后，通过尺度置信度优化策略对置信度高的尺度结果实现门控输出。所提算法能缓解模型漂移问题，同时有利于增强跟踪器的鲁棒性和提升跟踪精度。在两个最为流行的评测数据集VOT2018和OTB100上进行了实验，结果表明：在VOT2018数据集上，所提算法的期望平均重叠率（EAO）指标比基于重叠度最大化准确跟踪算法（ATOM）提高2.2个百分点，相较于基于可学习的判别模型跟踪器（DiMP）提高1.9个百分点；同时，所提算法在OTB100评测数据集上的成功率指标比ATOM高出1.3个百分点，特别是在非刚性形变属性上效果显著。所提算法在评测数据集上的平均运行速率均超过25 frame/s实现了实时跟踪。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于多层特征增强的实时视觉跟踪

费大胜, 宋慧慧, 张开华

计算机应用 2020, 40 (11): 3300-3305. DOI: 10.11772/j.issn.1001-9081.2020040514

摘要（322）

PDF （2493KB）（305）

为了解决全卷积孪生视觉跟踪网络（SiamFC）出现相似语义信息干扰物使得跟踪目标发生漂移，导致跟踪失败的问题，设计出一种基于多层特征增强的实时视觉跟踪网络（MFESiam），分别去增强高层和浅层的特征表示能力，从而提升算法的鲁棒性。首先，对于浅层特征，利用一个轻量并且有效的特征融合策略，通过一种数据增强技术模拟一些在复杂场景中的变化，例如遮挡、相似物干扰、快速运动等来增强浅层特征的纹理特性；其次，对于高层特征，提出一个像素感知的全局上下文注意力机制模块（PCAM）来提高目标的长时定位能力；最后，在三个具有挑战性的跟踪基准库OTB2015、GOT-10K和2018年视觉目标跟踪库（VOT2018）上进行大量实验。实验结果表明，所提算法在OTB2015和GOT-10K上的成功率指标比基准SiamFC分别高出6.3个百分点和4.1个百分点，并且以每秒45帧的速度运行达到实时跟踪。在VOT2018实时挑战上，所提算法的平均期望重叠率指标超过2018年的冠军，即高性能的候选区域孪生视觉跟踪器（SiamRPN），验证了所提算法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

4. 混合阶通道注意力网络的单图像超分辨率重建

姚鲁, 宋慧慧, 张开华

计算机应用 2020, 40 (10): 3048-3053. DOI: 10.11772/j.issn.1001-9081.2020020281

摘要（273）

PDF （3787KB）（435）

目前用于图像超分辨率重建的通道注意力机制存在注意力预测破坏每个通道和其权重的直接对应关系以及仅仅只考虑一阶或二阶通道注意力而没有综合考虑优势互补的问题，因此提出一种混合阶通道注意力网络的单图像超分辨率重建算法。首先，该网络框架利用局部跨通道相互作用策略将之前一、二阶通道注意力模型采用的升降维改为核为 k的一维卷积。这样不仅使得通道注意力预测更直接准确，而且得到的模型相比之前的通道注意力模型更简单；同时，采用改进一、二阶通道注意力模型以综合利用不同阶通道注意力的优势，提高网络判别能力。在基准数据集上的实验结果表明，和现有的超分辨率算法相比，所提算法重建图像的纹理细节和高频信息能得到更好的恢复，且在Set5和BSD100数据集上感知指数（PI）分别平均提高0.3和0.1。这表明此网络能更准确地预测通道注意力并综合利用了不同阶通道注意力，一定程度上提升了性能。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于双重金字塔网络的视频目标分割方法

姜斯浩, 宋慧慧, 张开华, 汤润发

计算机应用 2019, 39 (8): 2242-2246. DOI: 10.11772/j.issn.1001-9081.2018122566

摘要（571）

PDF （787KB）（213）

针对复杂视频场景中难以分割特定目标的问题，提出一种基于双重金字塔网络（DPN）的视频目标分割方法。首先，通过调制网络的单向传递让分割模型适应特定目标的外观。具体而言，从给定目标的视觉和空间信息中学习一种调制器，并通过调制器调节分割网络的中间层以适应特定目标的外观变化。然后，通过基于不同区域的上下文聚合的方法，在分割网络的最后一层中聚合全局上下文信息。最后，通过横向连接的自左而右结构，在所有尺度中构建高阶语义特征图。所提出的视频目标分割方法是一个可以端到端训练的分割网络。大量实验结果表明，所提方法在DAVIS2016数据集上的性能与较先进的使用在线微调的方法相比，可达到相竞争的结果，且在DAVIS2017数据集上性能较优。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于双重注意力孪生网络的实时视觉跟踪

杨康, 宋慧慧, 张开华

计算机应用 2019, 39 (6): 1652-1656. DOI: 10.11772/j.issn.1001-9081.2018112419

摘要（546）

PDF （800KB）（414）

为了解决全卷积孪生网络（SiamFC）跟踪算法在跟踪目标经历剧烈的外观变化时容易发生模型漂移从而导致跟踪失败的问题，提出了一种双重注意力机制孪生网络（DASiam）去调整网络模型并且不需要在线更新。首先，主干网络使用修改后表达能力更强的并适用于目标跟踪任务的VGG网络；然后，在网络的中间层加入一个新的双重注意力机制去动态地提取特征，这种机制由通道注意机制和空间注意机制组成，分别对特征图的通道维度和空间维度进行变换得到双重注意特征图；最后，通过融合两个注意机制的特征图进一步提升模型的表征能力。在三个具有挑战性的跟踪基准库即OTB2013、OTB100和2017年视觉目标跟踪库（VOT2017）实时挑战上进行实验，实验结果表明，以40 frame/s的速度运行时，所提算法在OTB2013和OTB100上的成功率指标比基准SiamFC分别高出3.5个百分点和3个百分点，并且在VOT2017实时挑战上面超过了2017年的冠军SiamFC，验证了所提出算法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

7. 通道稳定性加权补充学习的实时视觉跟踪算法

樊佳庆, 宋慧慧, 张开华

计算机应用 2018, 38 (6): 1751-1754. DOI: 10.11772/j.issn.1001-9081.2017112735

摘要（495）

PDF （584KB）（290）

为解决补充学习（Staple）跟踪算法在平面内旋转、部分遮挡时存在的跟踪失败问题，提出了一种通过通道稳定性加权的补充学习（CSStaple）跟踪算法。首先，使用标准相关滤波分类器检测出每层通道的响应值；然后，计算获得每层通道的稳定性权重，并乘到每层权重上，获得相关滤波响应；最后，通过融合颜色补充学习器的响应，得到最终的响应结果，响应中的最大值的位置即为跟踪结果。将所提算法与层和空间可靠性判别相关滤波（CSR-DCF）跟踪、对冲深度跟踪（HDT）、核化相关滤波（KCF）跟踪和Staple等跟踪算法进行了对比实验。实验结果表明，所提算法在成功率上表现最优，在OTB50和OTB100上比Staple分别高出2.5个百分点和0.9个百分点，验证了所提算法对目标在平面内旋转和部分遮挡时的有效性。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于极深卷积神经网络的人脸超分辨率重建算法

孙毅堂, 宋慧慧, 张开华, 严飞

计算机应用 2018, 38 (4): 1141-1145. DOI: 10.11772/j.issn.1001-9081.2017092378

摘要（627）

PDF （890KB）（511）

针对多种放大倍数的人脸超分辨率重建问题，提出一种基于极深卷积神经网络的人脸超分辨率重建方法，并通过实验发现增加网络深度能够有效提升人脸重建的精度。首先，设计一个包含20个卷积层的网络从低分辨率图片和高分辨率图片之间学习一种端到端的映射关系，并通过在网络结构中将多个小的滤波器进行多次串联以扩大提取纹理信息的范围。其次，引入了残差学习的方法来解决随着深度的提升细节信息丢失的问题。另外，将不同放大因子的低分辨率人脸图片融合到一个训练集中训练，使得该卷积网络能够解决不同放大因子的人脸超分辨率重建问题。在CASPEAL测试集上的结果显示，该极深卷积神经网络的方法比基于双三次插值的人脸重建方法在峰值信噪比（PSNR）和结构相似度上有2.7 dB和2%的提升，和SRCNN的方法比较也有较大的提升，在精度和视觉改善方面都有较大提升。这显示了更深的网络结构能够在重建中取得更好的结果。

参考文献 | 相关文章 | 多维度评价

Select

9. 融合时空多特征表示的无监督视频分割算法

李雪君, 张开华, 宋慧慧

计算机应用 2017, 37 (11): 3134-3138. DOI: 10.11772/j.issn.1001-9081.2017.11.3134

摘要（537）

PDF （1045KB）（471）

针对视频分割的难点在于分割目标的无规则运动、快速变换的背景、目标外观的任意变化与形变等，提出了一种基于时空多特征表示的无监督视频分割算法，通过融合像素级、超像素级以及显著性三类特征设计由细粒度到粗粒度的稳健特征表示。首先，采用超像素分割对视频序列进行处理以提高运算效率，并设计图割算法进行快速求解；其次，利用光流法对相邻帧信息进行匹配，并通过K-D树算法实现最近邻搜索以引入各超像素的非局部时空颜色特征，从而增强分割的鲁棒性；然后，对采用超像素计算得到的分割结果，设计混合高斯模型进行完善；最后，引入图像的显著性特征，协同超像素分割与混合高斯模型的分割结果，设计投票获得更加准确的视频分割结果。实验结果表明，所提算法是一种稳健且有效的分割算法，其结果优于当前大部分无监督视频分割算法及部分半监督视频分割算法。

参考文献 | 相关文章 | 多维度评价

Select

10. 深浅层表示融合的半监督视频目标分割

吕潇宋慧慧樊佳庆

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2021091640
预出版日期: 2022-04-15

Select

11. CCML2017+218+联合时空多特征表示的无监督视频分割方法

李雪君张开华宋慧慧

录用日期: 2017-05-31